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摘 要 : 


[目的 /意义 ] 目前 ,对 于 防风 药材 产地 和 品质 的 鉴别 方法 主要 是 根据 其 物理 或 化 学 特征 ， 
药材 进行 分 离 提取 ， 存 在 耗 时 长 ， 费 用 高 ， 专 业 性 强 ， 技 术 难 度 大 等 问题 ， 不 利于 推广 应 
断 发 展 ， 其 无 需 人 工 提取 特征 、 分 类 精度 高 等 优点 被 广泛 应 用 在 中 药材 的 识别 之 中 。[ 方 法 ] 


其 方法 需 对 中 
]。 随 着 深度 学 习 的 不 
针对 大 多 数 卷 积 神经 


网 络 模型 在 识别 防风 药材 时 计算 量 大 、 精 度 低 的 问题 ， 本 研究 提出 了 一 种 改进 的 ShuffleNet V2 的 轻 量 级 防风 道 地 
性 识别 模型 。 在 不 降低 网 络 性 能 的 情况 下 调整 模型 架构 ， 减 少 模型 参数 量 和 计算 量 ， 用 沙漏 残 差 网 络 (Hourglass 
Residual Network) 代替 传统 残 差 网 络 ， 同 时 引入 SE (Squeeze-and-Excitation) 注意 力 机 制 ， 把 具有 附加 信道 注意 


力 的 沙漏 残 差 网 络 谍 入 到 ShuffleNet V2 中 ， 使 用 SiLU 激 活 
出 轻 量化 的 中 药 防 风 道 地 性 识别 模型 Shuffle-Hourglass SE。 为 了 验证 本 文 所 提出 模型 的 有 效 性 ， 


KA ReLU 激活 函数 ， 丰 富 局 部 特征 学 习 ， 从 而 提 
选用 VGG16、 


MobileNet V2, ShuffleNet V2 fll SqueezeNet V2 四 种 经 典 网 络 模型 进行 对 比 实验 。[ 结 果 和 讨论 ] 结果 表明 ， 本 研究 
提出 的 模型 Shuffle-Hourglass SE 获得 了 最 佳 性 能 。 在 测试 集 上 取得 95.32% 的 准确 率 、95.28% 的 召回 率 ， 书 分数 达 


到 95.27% ， 测 试 时 间 、 模 型 大 小 为 246.34 ms 和 3.23 M， 不 仅 在 传统 CNN 网 络 中 是 最 优 的 ， 在 轻 量 级 网 络 中 也 具 


有 较 大 优势 。[ 结 论 ] 本 研究 所 提出 的 模型 在 保持 较 高 识别 精度 的 同时 占用 较 少 的 储存 空间 ， 有 助 于 在 未 来 的 低 性 


能 终端 上 实现 防风 道 地 性 的 实时 诊断 。 


关键 词 : 防风 ; 道 地 性 识别 ; ShuffleNet V2; SE 注意 力 机 制 ; 沙漏 残 差 网 络 ; 中 药材 ; 轻 量 级 模型 


中 图 分 类 号 : R282.5;TP391.4 


文献 标志 码 : A 


文章 编号 : SA202304003 


引用 格式 : 赵 筋 , 任 艺 平 , Fin, 郑 丹阳 , 村 东明 . 基于 改进 ShuffleNet V2 的 轻 量 级 防风 药材 道 地 性 智能 识别 加. 智慧 


农业 (中 英文 ), 2023, 5(2): 104-114. 


ZHAO Yu, REN Yiping, PIAO Xinru, ZHENG Danyang, LI Dongming. Lightweight intelligent recognition of Saposhniko- 
via Divaricata (Turcz.) Schischk originality based on improved ShuffleNet V2[J]. Smart Agriculture, 2023, 5(2): 104-114. 


15| E 


中 药材 对 人 体 疾 病 的 预防 及 控制 具有 重要 的 作 
用 ~o W KU (Saposhnikovia divaricata 
Schischk) 是 人 金 形 科 植 物 防 风 未 抽 营 的 干燥 根 ， 微 
甘 、 味 辛 、 性 温 ， 是 中 国 东北 地 区 具有 人 解 表 祛 风 、 
止 次 和 胜 湿 之 功效 的 著名 道 地 药材 ， 其 道 地 产 区 位 
于 内 蒙古 、 吉 林 、 辽 宁 和 黑龙 江 四 省 交界 处 。 目 
前 ， 对 于 防风 药材 产地 和 品质 的 鉴别 方法 主要 是 根 


(Turcz.) 
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据 其 物理 或 化 学 特征 "， 但 是 无 法 对 防风 药材 的 道 
地 性 中 质量 优 劣 进行 准确 衡量 。 

目前 已 有 相关 研究 对 药材 道 地 性 进行 建 模 识 
别 。 张 冬 月 等 中 采用 PEN3 电子 鼻 系 统 对 不 同 产地 
通关 腾 及 其 混淆 品 气 味 进行 定量 表征 ， 建 立 真 伪 品 
及 道 地 性 识别 模型 ， 并 采用 判别 因子 分 析 验 证 模型 
的 准确 性 ， 可 达 90% 以 上 。 刘 飞 等 中 利用 傅 里 叶 
变换 红外 光谱 结合 判别 分 析 对 三 七 的 道 地 性 及 产地 
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进行 鉴别 研究 ， 测 试 了 11 个 县 13 个 种 植 点 的 136 株 
三 七 主根 样品 的 红外 光谱 ， 预 测 正确 率 为 76.5%。 
Zhang ^F ^ 通过 化 学 计量 学 方法 ， 对 不 同 产地 的 药 
材 进 行 分 类 、 区 分 和 建 模 ， 最 终 实现 产地 追溯 的 目 
的 。 上 述 现代 技术 虽然 解决 了 传统 辨 状 论 质 的 主观 
性 强 的 问题 ， 使 鉴别 数据 化 、 客 观 化 ， 在 中 药 的 道 
地 性 区 分 上 有 较 好 的 应 用 前 景 ， 但 其 方法 需 对 中 药 
材 进 行 分 离 提取 ， 存 在 耗 时 长 、 费 用 高 、 专 业 人 性 
强 、 技 术 难 度 大 等 问题 ， 不 利于 推广 应 用 。 

深度 学 习 算 法 的 出 现 大 大 提高 了 传统 识别 任务 
中 的 识别 率 ， 尤 其 是 深度 学 习 领 域 中 的 卷 积 神经 网 
络 (Convolutional Neural Networks，CNN) ， 正 在 
迅速 成 为 图 像 识 别 的 首选 方法 。 人 们 提出 对 基于 
CNN 模型 进行 各 种 修改 ， 从 而 实现 高 精度 和 高 速 
度 处 理 视觉 任务 “”。 随 着 基于 CNN 模型 的 发 展 ， 
研究 人 员 提 出 了 一 系列 优秀 的 网 络 ， 包 括 
AlexNet ", VGGNet " , GoogLeNet ", ResNet * 
fll DenseNet 等 ,并 逐渐 应 用 于 植物 病害 严重 程 
度 识别 的 研究 。 

随 着 深度 学 习 的 不 断 发 展 ， 其 无 需 人 工 提 取 特 
征 、 分 类 精度 高 等 优点 被 广泛 应 用 在 不 同 领域 ， 同 
时 不 断 有 研究 将 深度 学 习 引 入 中 药材 的 识别 之 中 ， 
其 中 中 药材 的 种 类 和 其 质量 的 识别 是 重 中 之 重 。 赵 
潇潇 利用 CNN 对 不 同 产地 的 枸杞 外 观 图 像 进行 
村 征 提取 ， 最 终 实现 枸杞 道 地 性 在 线 识 别 ， 准 确 率 
可 达 96%。 李 东明 等 …“ 将 协调 注意 力 模型 与 残 差 
模块 进行 融合 ， 在 迁移 学 习 和 数据 扩充 方式 下 新 模 
型 对 中 药材 图 像 的 识别 准确 率 可 达 97.23%。Lyu 
等 "收集 了 100 种 常见 中 药 的 图 像 ， 用 目前 主流 
的 目标 检测 模型 ， 结 果 显 示 YOLOv5 模 型 在 识别 各 
种 TCM (Traditional Chinese Medicine) 方面 有 明显 
的 优势 ， 平 均 准确 率 为 94.33%。Xing 等 "采用 
PyTorch 和 Keras 框架， 手工 构建 了 一 个 DenseNet 
模型 ， 用 于 识别 各 种 中 药 ， 结 合 转移 学 习 的 思想 ， 
最 高 识别 率 可 以 达到 97.5%。 但 是 ， 大 多 数 CNN 由 
于 自身 深度 旦 复杂 的 网 络 结构 而 具有 较 大 的 参数 量 
和 计算 量 ， 使 得 模型 依赖 于 计算 机 能 力 强 大 的 GPU 
难以 应 用 于 硬件 资源 有 限 的 便携 式 设备 ， 不 利于 实 
施 中 药材 道 地 性 的 便捷 识别 。 为 了 使 CNN 应 用 于 
移动 端 和 骨 入 式 设备 ， 一 些 研究 人 员 提 出 了 轻 量化 


神经 网 络 ， 例 如 Xception |’, MobileNet "', Mo- 
bileNet V2 ^" 和 ShuffleNet V2 7 等 。 轻 量化 网 络 
参数 量 较 小 、 对 内 存 要 求 较 低 ， 它 们 在 速度 和 准确 
性 之 间 实 现 了 良好 的 平衡 ， 适 用 于 内 存 资源 受 限 的 
移动 端 设备 ， 目 前 ， 基 于 轻 量化 网 络 的 识别 已 逐渐 
成 为 一 个 研究 热点 。 刘 雪 纯 等 7" Xf MobileNet V2 
的 预 训练 模型 参数 进行 多 次 微调 ， 实 现 了 12 类 中 
药材 图 片 识别 ， 最 终 在 验证 集 上 精度 可 达 93%， 训 
练 时 间 上 也 比 普通 卷 积 神经 网 络 节 省 了 2 倍 以 上 。 

本 研究 针对 中 药材 防风 同 物种 空间 形态 和 颜色 
纹理 特征 较为 复杂 ， 区 分 度 较 低 等 问题 ， 提 出 一 种 
附加 信道 注意 力 的 沙漏 残 差 网 络 用 于 防风 道 地 性 识 
别 ， 改 进 后 的 模型 可 以 在 保证 高 分 类 精度 的 同时 减 
少 对 内 存 空间 的 占用 ， 可 以 有 效 地 应 用 于 不 同性 能 
的 硬件 平台 ， 为 进一步 开发 低 成 本 的 基于 终端 的 防 
风 道 地 性 自动 识别 系统 提供 技术 和 方法 。 


2 研究 方法 


2.1 深度 可 分 离 卷 积 


为 了 加 快 网 络 的 计算 速度 并 减少 计算 量 ，Mo- 
bileNet 网 络 提出 了 深度 可 分 离 卷 积 。 传 统 的 卷 积 使 
用 NXN 卷 积 核 通 过 卷 积 运算 ， 深 度 可 分 离 卷 积 
为 深度 卷 积 和 逐 点 卷 积 的 ， 相 当 于 使 用 通道 数 为 1 
的 卷 积 核 对 输入 特征 的 每 个 通道 执行 单独 的 卷 积 运 
算 。 输 入 图 像 大 小 为 HX WW， 五 代表 特征 图 的 高 度 ， 
代表 其 宽度 ，N 是 输入 通道 的 数量 ， 卷 积 核 的 大 
小 用 KXK 表 示 ，M 和 NN 分 别 表示 卷 积 核 和 输出 特 
征 映射 通道 的 数量 ,计算 成 本 和 深度 卷 积 参数 数量 
分 别 为 HXWXMXN 和 MN。 

如 公式 (1) 所 示 ， 深 度 可 分 离 卷 积 计算 成 本 
与 标准 卷 积 计算 成 本 的 比率 为 : 

HXWXNXK'HHXWXMXN 1,1 (y 

HXWXNXK'XM M K 

在 ShuffleNet V2 F, MERKS, JF HIRE 
卷 积 内 核 大 小 KK 通 常 为 3， 因 此 与 标准 卷 积 相 比 ， 
计算 成 本 和 参数 数量 均 可 以 显著 降低 到 1/8 一 1/9。 


2.2 模型 网 络 结构 调整 


为 了 在 不 影响 模型 性 能 的 基础 上 ， 尽 可 能 减少 
参数 以 及 计算 量 的 消耗 ， 在 本 研究 中 ，ShuffleNet 
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V2 中 Stage2、Stage3 和 Staged 的 堆 竺 个 数 都 降 为 
1 个 。 在 网 络 初 始 3X3 常 规 卷 积 之 后 ， 使 用 channel 
数 为 24、 卷 积 核 大 小 为 3X3， 步 长 为 2 的 深度 可 分 
离 卷 积 ， 以 提出 更 加 有 效 且 丰富 的 特征 Shuf- 
fleNet V2 网 络 结构 如 图 1 所 示 ， 改 进 后 网 络 模型 


224x224x3 


112x112x24 


Shuffle-Hourglass SE 的 内 部 参数 如 表 1 所 示 ， 表 中 
阶段 2， 阶 段 3， 阶 段 4 均 由 基本 单元 和 下 采样 单元 
两 部 分 组 成 ， 步 长 为 2 时 ， 表 示 使 用 下 采样 单元 缩 
小 输出 的 尺寸 ， 步 长 为 1 时 ,使 用 基本 单元 特征 提 
取 ， 此 时 不 进行 下 采样 操作 。 


56X56X24 
28x28x244 14x14x488 X 7x7x1024 TUN — 
— i — E — — 一 ES 一 一 
Stage 3 Stage 4 Conv 5 GlobalPool FC 
Stage 2 
MaxPool 
Input Conv | 
图 1 ShuffleNet V2 网 络 结构 
Fig. 1 Network architecture of ShuffleNet V2 
表 1 Shuffle-Hourglass SE 模型 内 部 参数 
Table 1 Internal parameters of Shuffle-Hourglass SE model 
结构 层 输出 尺寸 卷 积 核 大 小 步 长 重复 数 /次 输出 通道 
输入 224X224 — -— ES 
TRI 112X 112 3X3 2 1 24 
深度 可 分 卷 积 2 56X56 3x3 2 1 24 
28 X28 2 1 
阶段 2 —— 244 
28X28 1 1 
14X14 2 1 
阶段 3 — 488 
14x 14 1 1 
7X7 2 1 
阶段 4 — 976 
7X 1 1 
卷 积 5 7X7 一 一 1 1 2048 
平均 池 化 1XI 7X1 — 一 一 一 一 
a= = = = 吉林 /内 蒙古 /甘肃 /黑龙 江 /河北 


2.3 附加 信道 注意 力 的 沙漏 残 差 网 络 


ShuffleNet ?' , MobileNet "" , Xception " 、 
ResNet > 等 利用 信道 混 洗 和 深度 可 分 离 卷 积 来 优 
化 ResNet 的 残 差 结构 ， 既 保证 了 网 络 的 准确 性 ， 又 
提高 了 模型 的 运算 效率 。 与 倒 残 差 模块 不 同 ， 沙 漏 
残 差 网 络 可 以 从 高 维特 征 获 取 到 更 多 的 信息 ， 并 解 
决 shortcut 连 接 所 带 来 的 梯度 问题 。 使 用 深度 卷 积 ， 
然后 利用 批量 标准 化 和 激活 函数 将 输入 特征 图 分 为 
两 批 X1 和 X2 ，X2 通过 深度 可 分 离 卷 积 、 两 次 1 X 
1 卷 积 、 再 进行 深度 可 分 离 卷 积 ， 然 后 利用 批量 标 
准 化 、Sigmoid 激 活 函 数 O 和 XI1 和 X2 与 深度 和 非 
深度 特征 融合 ， 最 后 使 用 信道 混 洗 "来 混合 深度 
和 非 深 层 特征 。 在 特征 向 量 中 加 入 了 激活 函数 和 线 


性 映射 增加 了 更 多 的 非 线 性 条 件 ， 可 以 更 好 地 拟 
合 通 道 之 间 的 复杂 相关 性 ， 最 后 ， 将 计算 出 的 通道 
特征 与 原始 特征 图 相 乘 ， 得 到 通道 保持 的 输出 。 撞 
压 和 激励 结构 SE (Squeeze-and-Excitation) 模块 的 
结构 如 图 2 所 示 。 首 先 ， 具 有 通道 总 数 C 和 大 小 
HX 克 W 的 特征 图 U 通 过 全 局 池 Ff 被 平坦 化 为 (1， 
1，C) 的 特征 向 量 ， 如 公式 (2) 所 示 。 

Ze Falttd) = app in Gd) (2) 

HP, F 为 压缩 操作 ; u EREE U BOP SAE 
Hj G, 1, C); 2Z. 为 关注 的 通道 数 。 

将 SE 通道 注意 力 “模块 插入 沙漏 残 差 网 络 的 
深度 可 分 离 卷 积 后 ， 对 深度 可 分 离 卷 积 的 输出 进行 
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通道 维度 的 特征 提取 ， 附 加 信道 注意 力 的 沙漏 残 差 TAN 
网 络 结构 模型 如 图 3 所 示 ， 通 道 混 洗 过 程 如 图 4 
Fale, W) 
FA 7) M — TH X 
E = 1x1xC 1x1xC E 
-— bi E. Feal. 7) -— 
H 
e i [e z ë x 
图 2 挤 压 和 激励 块 结构 (SE 模块 ) 
Fig. 2 Structure of extrusion and excitation block (SE module) 
Channel_shuffle | — 
3 9 8 
alae aso | Conv 2 
5 FC FC Global_pooling ji 
T a Xl Depth wise conv Scale | Conv 1 
featuremap © bs FT 
x2 FC Lu 
SoS —dm9— 
Global pooling 
图 3 附加 信道 注意 力 的 沙漏 残 差 网 络 
Fig. 3 Hourglass residual network with additional channel attention 
图 4 通道 混 洗 过 程 
Fig. 4 Channel mixing process 
2.4 SiLU 激 活 函 数 f (x) = max (0, x) (3) 
MM v 其 中 ，x 为 激活 函数 的 输入 ; max( ) 为 求 最 大 值 
不 同 产 地 的 防风 间 存 在 数据 不 平衡 问题 ， 图 片 函数 
Xr des /> A 
数量 较 少 的 类 别 在 训练 过 程 中 容易 出 现 过 拟 合 现 SiLU 激 活 函 数 5 在 保留 ReLU 激活 函数 优点 
4, ShuffleNet V2 中 的 ReLU 激活 函数 ， 通 过 引 的 同时 ， 可 以 更 好 地 解决 神经 元 坏死 问题 ， 函 数 表 


入 ReLU 输 入 的 称 蕊 性 ， 可 以 减少 ReLU 输 入 的 达 式 如 公式 (4) 所 示 。ReLU 和 SiLU 函数 对 比 图 
不 必要 负 值 ， 可 以 提高 训练 网 络 的 泛 化 能 力 ， 如 公 E 与 ReLU 不 同 ，SiLU 是 平滑 的 、 非 
式 (3) 所 示 。 单调 的 , 将 SiLU 激 活 函 数 替 换 ShuffleNet V2 FÆ 
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样 单元 和 基本 单元 中 的 ReLU 激活 函数 ， 可 以 提高 
模型 的 整体 性 能 。 


A 


l+e 


(4) 


-要 -ReLU —e—SiLU 
6 


图 5 SiLU 和 ReLU 函数 对 比 图 像 


Fig. 5 SiLU and ReLU functions compare image 
2.5 ShuffleNet V2 网 络 结构 改进 


研究 发 现 ， 反 向 残 差 块 是 由 中 间 扩 展 层 编 码 的 
寺 征 图 首先 投影 到 低 维特 征 图 ,存在 信道 压缩 而 无 
法 保留 足够 的 有 用 信息 的 问题 ， 沙 漏 残 差 块 主 分 支 
中 的 第 一 个 和 最 后 一 个 卷 积 层 是 保留 通道 的 空间 深 
度 卷 积 层 ， 可 以 从 高 维特 征 获取 到 更 多 的 信息 。 经 
普 鉴 沙漏 残 差 重 要 思想 ， 本 研究 将 改进 的 残 差 模块 
引进 到 ShuffleNet V2 中， 用 沙漏 残 差 网 络 代替 倒 残 
差 网 络 ， 将 SE 通道 注意 力 模块 插入 沙漏 残 差 网 络 
的 深度 可 分 离 卷 积 后 ， 把 具有 附加 信道 注意 力 的 沙 
漏 残 差 网 络 能 入 ShuffleNet V2 中 ，SE 注 意 力 通过 
控制 通道 比例 的 大 小 来 增强 重要 特征 ， 削 弱 不 重要 
特征 ， 使 提取 的 特征 更 有 方向 性 。 用 SiLU 替换 
ShuffleNet V2 下 采样 单元 和 基本 单元 中 的 ReLU 激 
活 函 数 ， 可 以 增强 模型 的 泛 化 能 力 ， 同 时 在 不 降低 
网 络 性 能 的 情况 下 调整 模型 架构 ， 减 少 模型 参数 量 
和 计算 量 。 本 研究 提出 的 改进 的 ShuffleNet V2 网 络 
结构 ShuffleNet-Hourglass SE 模型 如 图 6 所 示 。 


3 试验 及 结果 分 析 


3.1 数据 集 来 源 及 预 处 理 


本 研究 所 用 防风 样品 由 吉林 农业 大 学 中 药材 学 
院 实验 室 提供 ， 均 为 主要 产 区 的 正品 样本 ， 包 括 来 
自 黑 龙 江 、 吉 林 、 河 北 、 甘 肃 、 内 蒙古 5 个 产地 共 
计 1000 余 份 。 在 室内 白 日 光 下 使 用 手机 拍摄 获取 5 


个 产地 的 防风 药材 图 像 共 5234 幅 ， 充 分 考虑 了 不 
同 防风 的 地 域 分 布 差 异 。 利 用 随机 翻转 、 随 机 裁 
剪 、 亮 度 和 对 比 度 增强 等 处 理 ， 将 数据 集 扩 充 至 
10,120 幅 防风 图 人像， 增强 数据 样本 ， 部 分 数据 集 图 
像 如 图 7 所 示 。 将 整个 数据 集 的 80% 作为 训练 集 ， 
另外 20% 作 为 测试 集 ， 数 据 集 划 分 如 表 2 所 示 。 


3.2 试验 设置 


为 了 保证 迭代 效率 并 提高 模型 的 稳定 性 和 可 推 
广 性 ， 每 幅 输 入 图 像 像 素 大 小 被 固定 为 224 X 224, 
优化 器 使 用 Adam， 批 次 大 小 设置 为 32， 学 习 率 初 
始 化 为 0.001， 和 迭代 次 数 为 50 次 ,试验 在 Linux 操 
作 系 统 上 进行 ，CPU 型 号 为 Intel (R) Core (TM) 
i7-10900K，RAM 为 32 GB 的 DDR4，CUDA 版 本 
为 11.4， 并 构建 基于 Python 3.9 编程 语言 的 Pytorch 
深度 学 习 框 架 。 


3.3 模型 评估 标准 


通过 召回 率 (Recall) 、 精 确 率 (Precision) , 
准确 率 (Accuracy) 、 忆 分数 (F, score) 等 相关 参 
数 进行 网 络 性 能 评估 ， 其 相关 计算 如 公式 (5) 一 
(8) 所 示 ， 并 且 把 模型 参数 量 和 模型 在 单 幅 防 风 图 
片 识 别 上 的 平均 时 间作 为 模型 复杂 度 的 对 比 


[29] 


HER ”。 


TP + TN 


= xX 0, 
Accuracy TP LIN 4 FP 4 TN 100% (5) 
pede oe A 
Precision = y -pp X 100% (6) 
Rs 了 (7) 
TP + FP 


2 X Precision X Recall 
Precision + Recall 


其 中 ，TP 为 网 络 识别 正确 的 正 样本 的 数量 ; 
TN 为 网 络 错误 识别 的 负 样 本 数量 ; FP 为 网 络 错误 
识别 的 正 样本 数量 。 


3.4 实验 结果 与 分 析 


3.4.1 不 同 模 型 性 能 对 比 实验 

为 了 评价 本 研究 所 提出 模型 的 有 效 性 ， 选 择 
VGG16、MobileNet V2, ShuffleNet V2 和 SqueezeNet 
V2 四 种 模型 与 本 模型 ” 进行 对 比 实验 。 为 保证 对 
比 合 理性 ， 五 种 模型 均 使 用 本 文 所 提出 的 数据 集 ， 


X 100% (8) 
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图 6 ShuffleNet-Hourglass SE 防风 识别 模型 


Fig. 6 Saposhnikovia divaricata (Turcz.) Schischk identification model ShuffleNet-Hourglass SE 


表 2 防风 数据 集 划 分 


Table 2 Dataset division of Saposhnikovia divaricata ( Turcz.) 


随机 裁剪 亮度 增强 对 出 度 增强 


HA 
Schischk 
河北 原 产 地 测试 集 / 幅 训练 集 / 幅 图 像 数 量 / 幅 
甘肃 404 1617 2021 
— 河北 398 1589 1987 
黑龙 江 411 1642 2053 
吉林 470 1879 2349 
poe 内 蒙古 342 1368 1710 
并 在 相同 的 参数 下 进行 训练 ， 最 后 通过 在 测试 集 和 
图 7 防风 的 部 分 数据 集 图 像 训练 集 损失 值 、 准 确 率 、 召 回 率 、F 分 数 作为 模型 
Fig. 7 Selected images of the dataset for Saposhnikovia divari- 性 能 的 评价 指标 ， 实 验 结 果 如 图 8 和 图 9 所 示 。 
cata (Turcz.) Schischk 从 图 8 和 图 9 可 以 看 出 ， 本 研究 所 提出 的 Shuf- 


fle-Hourglass SE 模型 实现 了 更 低 的 损失 值 和 更 高 的 
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一 一 MobileNet V2 

—— ShuffleNet V2 
—VGG 

—— ShufTleNet-Hourglass SE 
—— SqueezcNet V2 


1353539 1 1D 15 17 19 21 23 25 27 29 31 33 35 37 39 4] 43 45 47 49 


选 代 次 数 /次 
(a) 不 同 模型 在 训练 集 的 准确 率 曲 线 图 


—— MobileNet V2 

—— ShuffleNet V2 

—VGG 

~~~ ShuffleNet-Hourglass SE 
—— SqueezeNet V2 


1 3 S$ 7 9 n nis 17 19 21 23 25 22229 31 33 35 37 39 4| 4 45 47 49 


PARR X 
(b) 不 同 模型 在 训练 集 的 loss 值 曲线 图 
图 8 不 同 模型 在 训练 集 的 准确 率 和 1oss 值 曲线 图 
Fig. 8 Accuracy and loss curves of different models in the 


training set 


一 一 MobileNet V2 

一 一 ShuffleNetV2 

一 一 ShuffleNet-Hourglass SE 
一 一 SqueezeNet V2 


1 3 $ 7 9 MH 13 15 17 19 21 23 25 27 29 31 33 35 37 39 41 43 4$ 47 49 


和 迭代 次 数 /次 
(a) 不 同 模型 在 测试 集 的 准确 率 曲线 图 


一 一 MobileNet V2 

一 一 Shu 们 eNet V2 
—VGG 

—— ShuffleNet-Hourglass SE 
—— SqueezeNet V2 


13.5729 H 1 I5 9? 19 21 22 25 27 29 341 33 35 37 39 4| 43 45 47 49 


达 代 次 数 /次 


(b) 不 同 模型 在 测试 集 的 loss 值 曲线 图 
图 9 不 同 模 型 在 测试 集 的 准确 率 和 损失 值 曲线 图 
Fig. 9 Accuracy and loss curves of different models in the 


test set 


准确 率 ， 在 训练 集 和 测试 集 上 的 损失 值 分 别 为 
0.075 和 0.122。 同 时 ， 可 以 看 出 本 研究 模型 的 收敛 
速度 优 于 ShuffleNet V2， 在 20 次 epoch 左 右 趋 于 收 
敛 ， 能 够 在 最 短 时 间 内 训练 出 最 优 的 模型 且 更 稳 
定 。 总 体 来 看 各 个 模型 的 loss 和 accuracy 收敛 曲线 ， 


在 测试 集 上 损失 值 略 高 于 训练 集 ， 在 测试 集 上 ac- 
curacy 略 低 于 训练 集 。 不 同 模型 在 测试 集 上 的 实验 
结果 如 表 3 所 示 。 

表 3 不 同 模型 在 测试 集 上 的 实验 结果 


Table 3 Experimental results of different models on the test set 


准确 “测试 时 召回 FARO 模型 大 


i 率 M Kims R% $U% 小 M 
MobileNet V2 84.82 315.65 84.91 84.46 5.21 
ShuffleNet V2 93.23 324.54 93.18 93.08 4.52 

VGG 87.91 876.54 88.02 87.82 99.72 


Shuffle-Hourglass SE 95.32 246.34 9528 9527 3.23 
SqueezeNet V2 62.71 161.98 62.88 62.43 6.03 


由 表 3 可 知 ， 本 研究 提出 的 模型 Shuffle-Hour- 
glass SE 获得 了 最 佳 性 能 。 在 测试 集 上 取得 95.32% 
的 准确 率 、95.28% 的 召回 率 ， 忆 分 数 达 到 95.27%, 
均 优 于 未 改进 的 ShuffleNet V2 模型 ， 并 比 Shuf- 
fleNet V2 模型 分 别提 高 了 2.09%、2.1% FI 2.1996. 
测试 时 间 、 模 型 大 小 为 246.34 ms 和 3.23 M， 不 仅 
在 传统 CNN 网 络 中 是 最 优 的 ， 在 轻 量 级 网 络 中 也 
具有 较 大 优势 。 

和 经 典 卷 积 网 络 VGG 相 比 ， 本 研究 提出 的 
Shuffle-Hourglass SE 模型 准确 率 提高 7.41%， 测 试 
时 间 缩 减 71.89%， 模 型 大 小 缩减 96.76%。 尽 管 
ShuffleNet V2 和 MobileNet V2 的 测试 时 间 相 近 ， 但 
改进 的 Shuffle-Hourglass SE 模 型 的 准确 率 和 速度 证 
明了 其 性 能 的 有 效 性 ， 测 试 时 间 比 MobileNet V2 缩 
减 69.31 ms， 模 型 大 小 缩减 1.98 M， 准 确 率 提 高 
10.5%。 在 分 类 精度 方面 ,改进 后 的 网 络 保持 了 较 
高 的 识别 精度 ， 并 且 分 类 性 能 良好 ， 类 似 地 与 未 改 
进 的 ShuffleNet 相 比 有 所 改进 ,与 其 他 轻 量 级 网 络 
相 比 有 显著 改进 。 

综 上 所 述 ， 本 研究 提出 的 模型 可 以 显著 提高 计 
算 效率 ， 同 时 在 分 类 精度 方面 获得 良好 的 性 能 ， 从 
而 在 模型 大 小 和 性 能 之 间 取 得 合理 的 平衡 。 

3.4.2 不 同 注意 力 机 制 对 模型 性 能 的 影响 

为 了 验证 本 研究 提出 的 SE 注意 力 机 制 在 附加 
信道 注意 力 的 沙漏 残 差 网 络 的 有 效 性 ， 与 ECA 
(Efficient Channel Attention) 注意 力 机 制 2、 
CBAM (Convolutional Block Attention Module) iE 
RAL 77. CA 注意 力 机 制 3 进行 对 比 ， 所 有 
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注意 力 机 制 引 入 到 ShuffleNet V2 模型 中 的 相同 位 
置 ， 实 验 结 果 如 表 4 所 示 。 对 比 ECA 注 意 力 机 制 ， 
在 模型 中 引入 SE 注意 力 机 制 的 准确 率 和 分 数 更 
高 ， 可 以 更 好 地 实现 通道 间 的 信息 交互 提升 模型 性 
能 。 相 比 于 CA 注意 力 机 制 ， 引 入 SE 注意 力 机 制 准 
确 率 和 已 分 数 分 别提 升 了 0.68% 和 0.82%， 参 数量 
à 0.51 M; 相 比 于 CBAM 注 意 力 机 制 ， 引 入 SE 注 
意 力 机 制 ， 模 型 的 准确 率 和 已 分 数 分 别提 升 了 
1.19% 和 1.38%， 参 数量 未 变化 。 因 此 ， 本 研究 提 
出 的 SE 注 意 力 机 制 具 有 更 优 参数 量 的 同时 ， 模 型 
的 准确 率 和 书 分 数 更 高 。 
表 4 不 同 注意 力 机 制 对 模型 性 能 的 影响 
Table 4 Effects of different attention mechanisms on 


model performances 


注意 力 机 制 ”准确 率 /% ”召回 率 /% 


分 数 /% ”参数 量 /M 


ECA 93.72 93.88 93.45 4.52 
SE 95.32 95.44 95.31 4.39 
CA 94.64 94.75 94.49 4.98 

CBAM 94.13 94.22 93.93 4.52 


3.4.3 不 同 激活 函数 对 模型 性 能 的 影响 

本 研究 将 ShuffleNet V2 模 型 下 采样 单元 和 基本 
单元 中 的 ReLU 激活 函数 被 SiLU 替换 ， 可 以 增强 
模型 的 泛 化 能 力 。 为 验证 其 有 效 性 ， 在 其 他 参数 均 
不 变 情况 下 选取 ReLU、H-swish ?, ELU ™ 激活 
函数 进行 对 比 ， 实 验 结果 如 表 5 所 示 。 从 表 5 可 以 
看 出 ， 相 比 于 ReLU 激 活 函 数 ， 使 用 ELU 激活 函数 
的 模型 效果 较 差 ; 使 用 H-Swish 激 活 函 数 的 模型 准 
确 率 和 ,分数 略 有 提升 ; 使 用 SiLU 激 活 函 数 的 模 
型 准确 率 可 达到 95.32%， 准 确 率 和 尺 分 数 分 别提 
升 了 2.09% 和 1.93%， 取 得 了 最 佳 效果 。 
3.4.4 Shuffle-Hourglass SE 模 型 的 消融 实验 结果 

为 了 探究 使 用 SE 模块 注意 力 机 制 、 沙 漏 残 差 

表 5 不 同 激活 函数 对 模型 性 能 的 影响 
Table 5 Effects of different activation functions on 


model performances 


激活 函数 准确 率 /% F IU% 
ReLU 93.23 93.11 

H-Swish 94.08 93.88 
ELU 92.98 92.96 
SiLU 95.32 95.04 


块 和 激活 函数 的 改进 方式 对 ShuffleNet V2 模型 带 来 
的 性 能 提升 叶 ， 本 人 研究 进行 Shuffle-Hourglass SE te 
型 消融 实验 ,实验 结果 如 表 6 所 示 。 


表 6 Shuffle-Hourglass SE 模型 消融 实验 结果 
Table 6 Ablation results of Shuffle-Hourglass SE model 


模型 注意 力 机 沙漏 残 激活 ”架构 参数 量 
制 模块 ” 差 块 函数 调整 
x x x x 9323 4.52 
v x x x 9453 452 
ShuffleNet V2 x y x x 9412 556 
x x y x 94.44 4.52 
Y v x x 94.92 5.56 
v v v x 9503 5.56 
Shuffle-Hourglass SE J y y V 9532 323 


由 表 6 可 以 看 出 ,在 ShuffleNet V2 中 增加 SE 
注意 力 机 制 ， 模 型 的 准确 率 提升 了 1.3%， 将 沙漏 残 
差 模块 引入 ShuffleNet V2 的 基本 单元 中 ， 模 型 的 准 
确 率 提升 了 0.89%， 但 是 模型 的 参数 量 增加 较 多 , 
使 用 SiLU 蔡 换 ReLU 激 活 函 数 ， 模 型 整体 准确 率 
提高 了 1.21%。 通 过 调整 模型 架构 ， 模 型 的 参数 量 
和 计算 量 显著 降低 。 最 终 ， 本 研究 提出 的 Shuffle- 
Hourglass SE 模型 的 准确 率 和 参数 量 为 95.3296 和 
3.23 M， 相 比 于 改进 之 前 的 ShuffleNet V2， 准 确 率 
上 升 了 2.09%， 参 数量 减少 了 1.29 M, 


4 结 论 


本 研究 针对 防风 同 物 种 空间 形态 和 颜色 纹理 特 
征 较为 复杂 ， 区 分 度 较 低 等 特点 ， 提 出 了 一 种 基于 
TES AHA ShuffleNet V2 的 防风 道 地 性 识别 网 络 模 
型 (Shuffle-Hourglass SE), ， 使 用 自主 拍摄 的 防风 图 
像 构 建 数据 集 ， 并 对 其 进行 加 强 。 

(1) 选用 ShuffleNet V2 为 基础 网 络 架 构 ， 用 沙 
漏 残 差 网 络 代替 传统 残 差 网 络 ， 同 时 引入 SE 注 意 
力 机 制 ， 把 具有 附加 信道 注意 力 的 沙漏 残 差 网 络 构 
入 到 ShuffleNetV2 中， 丰富 不 同 产 地 防风 的 局 部 特 
征 学 习 ， 优 化 道 地 性 识别 模型 ， 使 用 SILU GS K 
BUF Me ReLU 激活 函数 ， 进 一 步 提 高 了 ShuffleNet 
V2 的 性 能 。 

(2) 改进 后 的 Shuffle-Hourglass SE 模型 在 自 建 
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数据 集 上 的 准确 率 可 达 95.32%， 模 型 大 小 仅 为 
3.23 MB, ， 在 相同 测试 集 的 情况 下 ， 准 确 率 和 尺 分 
数 分 别提 高 了 1.69% 和 1.23%， 模 型 大 小 缩小 
96.76%。 李 东明 等 “9 所 提出 的 采用 改进 稠密 连接 
网 络 的 防风 药材 的 道 地 性 识别 方法 ， 虽 然 识别 率 可 
达到 97.23%， 比 本 人 研究 所 提出 的 模型 识别 率 高 
1.91%, 但 本 研究 所 提出 的 模型 在 参数 量 、 测 试 时 
间 和 模型 大 小 上 要 优 于 该 网 络 。 

本 模型 在 保持 较 高 识别 精度 的 同时 占用 较 少 的 
存储 空间 ， 而 且 在 测试 时 间 上 具有 一 定 优势 ， 同 时 
具有 高 度 便携 性 ， 有 助 于 在 未 来 的 低 性 能 终端 上 实 
现 防 风 道 地 性 的 实时 诊断 。 


利益 冲突 声明 : 本 研究 不 存在 研究 者 以 及 与 公开 
研究 成 果 有 关 的 利益 冲突 。 
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Abstract: 

[Objective] Saposhnikovia divaricata (Turcz.) Schischk is a kind of traditional Chinese medicine. Currently, the methods of identify- 
ing the origin and quality of Saposhnikovia divaricata (Turcz.) Schischk are mainly based on their physical or chemical characteris- 
tics, which is impossible to make an accurate measurement of Groundness identification. With the continuous development of deep 
learning, its advantages of no manual extraction and high classification accuracy are widely used in different fields, and an attention- 
embedded ShuffleNet V2-based model was proposed in this study to address the problems of large computation and low accuracy of 
most convolutional neural network models in the identification of Chinese herbal medicine Saposhnikovia divaricata (Turcz.) 
Schischk. 

[Methods] The model architecture was adjusted to reduce the number of model parameters and computation without degrading the 
network performance, and the traditional residual network was replaced by the Hourglass residual network, while the SE attention 
mechanism was introduced to embed the hourglass residual network with additional channel attention into ShuffleNet V2. The impor- 
tant features were enhanced and the unimportant features were weakened by controlling the size of the channel ratio to make the ex- 
tracted features more directional by SE attention. The SiLU activation function was used to replace the ReLU activation function to en- 
hance the generalization ability of the model Enriching local feature learning. Therefore, a lightweight Shuffle-Hourglass SE model 
was proposed. The samples of Saposhnikovia divaricata (Turcz.) Schischk used in this research were samples from the main produc- 
tion areas, including more than 1000 samples from five production areas in Heilongjiang, Jilin, Hebei, Gansu and Inner Mongolia. A 
total of 5234 images of Saposhnikovia divaricata (Turcz.) Schischk were obtained by using cell phone photography indoors under 
white daylight, fully taking into account the geographical distribution differences of different Saposhnikovia divaricata (Turcz.) 
Schischk. The data set of Saposhnikovia divaricata (Turcz.) Schischk images was expanded to 10,120 by using random flip, random 
crop, brightness and contrast enhancement processes. In order to verify the effectiveness of the model proposed, four classical network 
models, VGG16, MobileNet V2, ShuffleNet V2 and SqueezeNet V2, were selected for comparison experiments, ECA ( Efficient Chan- 
nel Attention ) attention mechanism, CBAM ( Convolutional Block Attention Module ) attention mechanism and CA attention mecha- 
nism were chosen to compare with SE. All attention mechanisms were introduced into the same position in the ShuffleNet V2 model, 
and ReLU, H-swish and ELU activation functions were selected for contrast experiments under the condition in which other parame- 
ters unchanged. In order to explore the performance improvement of ShuffleNet V2 model by using the attention mechanism of SE 
module, Hourglass residual block and activation function, Shuffle-Hourglass SE model ablation experiment was carried out. Finally, 
loss, accuracy, precision, recall and F, score in test set and training set were used as evaluation indexes of model performances. 
[Results and Discussions] The results showed that the Shuffle-Hourglass SE model proposed achieved the best performances. An 
accuracy of 95.32%, recall of 95.28%, and F, score of 95.27% were obtained in the test set, which was 2.09%, 2.1 %, and 2.19 % high- 
er than the ShuffleNet V2 model, respectively. The test duration and model size were 246.34 ms and 3.23 M, respectively, which were 
not only optimal among Traditional CNN such as VGG and Desnet,but had great advantages among lightweight networks such as Mo- 
bileNet V2, SqueezeNet V2 and ShufffleNet V2. Compared with the classical convolutional network VGG, 7.41% of the accuracy 
was improved, 71.89% of the test duration was reduced, and 96.76% of the model size was reduced by the Shuffle-Hourglass SE mod- 
el proposed in this study. Although the test duration of ShuffleNet V2 and MobileNet V2 were similar, the accuracy and speed of the 
Shuffle-Hourglass SE model improved, which proved its better performance. Compared with MobileNet V2, the test duration was re- 
duced by 69.31 ms, the model size was reduced by 1.98 M, and the accuracy was increased by 10.5 %. In terms of classification accu- 
racy, the improved network maintains higher recognition accuracy and better classification performance. 

[Conclusions] The model proposed in this research is able to identify the Saposhnikovia divaricata (Turcz.) Schischk originality 
well while maintaining high identification accuracy and consuming less storage space, which is helpful for realizing real-time identifi- 


cation of Saposhnikovia divaricata (Turcz.) Schischk originality in the future low performance terminals. 


Key words: Saposhnikovia divaricata (Turcz.) Schischk; originality recognition; ShuffleNet V2; SE attention mechanism; hourglass re- 
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